半监督学习(SSL)是使用不仅标记的示例,而且是未标记的示例学习预测模型的常见方法。尽管用于分类和回归的简单任务的SSL受到了研究社区的广泛关注,但对于具有结构依赖变量的复杂预测任务,这尚未得到适当的研究。这种情况是多标签分类和分层多标签分类任务,可能需要其他信息,可能来自未标记示例提供的描述性空间中的基础分布,以更好地面对同时预测多个类别标签的挑战性任务。在本文中,我们研究了这一方面,并​​提出了一种基于对预测性聚类树的半监督学习的(分层)多标签分类方法。我们还扩展了整体学习的方法,并提出了一种基于随机森林方法的方法。在23个数据集上进行的广泛实验评估显示了该方法的显着优势及其在其监督对应物方面的扩展。此外,该方法可保留可解释性并降低基于经典树模型的时间复杂性。
translated by 谷歌翻译
从未标记数据学习的需要在当代机器学习中增加。无监督特征排名的方法,该方法识别这些数据中最重要的特征是越来越关注,因此它们在研究高吞吐量生物实验或用户基础时的应用程序。我们提出了Frane(通过属性网络排名),一种无监督算法,能够在给定的未标记数据集中找到关键特征。Frane基于网络重建和网络分析的思路。正如我们经验上展示了大量基准的那样,Frane比最先进的竞争对手表现更好。此外,我们提供了Frane的时间复杂性分析进一步证明其可扩展性。最后,Frane优惠由于结果可解释的关系结构用于推导特征重要性。
translated by 谷歌翻译